Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态的计算,广泛应用于大数据相关的实际业务场景中。本书是一本从零开始讲解Flink的入门教材,学习本书需要有Java编程基础。
本书共分10章,内容包括Flink开发环境搭建、Flink架构和原理、时间和窗口、状态管理和容错机制、数据类型与序列化、DataStream API和DataSet API、Table API和SQL、Flink并行、Flink部署与应用,最后以一个Flink实战项目为例,对Flink相关知识进行综合实践,其中涉及Web页面展示、WebSocket协议和Node.js服务等技术。
本书内容详尽、示例丰富,适合作为Flink初学者必备的参考书,也非常适合作为高等院校和培训机构大数据及相关专业的师生教学参考。
more >
前 言
随着物联网、5G以及大数据技术的发展,人类已经进入大数据时代,毫不夸张地说,未来IT相关的职位,一项必备技能就是大数据处理能力。当前,人类基于大数据和人工智能等技术,在特定领域中可以大大提升业务系统的智能化水平。
人类对于计算速度的追求从未停止,即使面对海量的数据,我们也希望大数据框架可以在非常低的延迟下进行响应,从而提升用户的体验。
主流的分布式大数据计算框架有Storm、Spark和Flink,由于阿里对Flink的收购以及改进,目前Flink社区非常活跃,社区一直致力于统一流处理和批处理API,并逐步增强Flink SQL相关功能,即期望通过SQL来满足大部分的大数据ETL处理场景。另外,随着Flink SQL功能的增强和发展,也大大降低了Flink学习的难度。
目前,Flink在百度、阿里、字节跳动、小米和腾讯等商业巨头中有成熟的应用,每日可以处理万亿的事件,且可以维护TB级别的状态信息。Flink支持多种编程语言,可以用Java、Scala以及Python进行大数据业务处理。与此同时,Flink支持灵活的窗口计算以及乱序数据处理,这相对于其他大数据计算框架来说,有比较强的优势。
如果你对实时大数据处理感兴趣,致力于构建分布式大数据处理应用程序,并且有一点Java编程基础,那么本书适合你。本书作为Flink的入门教材,由浅入深地对Flink大数据处理方法进行介绍,特别对常用的DataStream API和DataSet API、Table API 和SQL进行了详细的说明,最后结合实战项目,将各个知识点有机整合,做到理论联系实际。
本书涉及的技术和框架
本书涉及的技术和框架包括Flink、IntelliJ IDEA、Java、Kafka、jQuery、HTML5、Node.js、Maven。
本书特点
(1)理论联系实际。本书先对Flink基本的安装过程进行说明,并对Flink分布式架构、内部数据处理过程等进行详细分析,最后结合示例代码进行说明,做到理论联系实际。
(2)深入浅出、轻松易学。本书以实例为主线,激发读者的阅读兴趣,让读者能够真正学习到Flink 最实用、最前沿的技术。
(3)技术新颖、与时俱进。本书结合当前最热门的技术,如Node.js和HTML5等,让读者在学习Flink的同时,了解更多相关的先进技术。
(4)贴心提醒。本书根据需要在各章使用了很多“注意”小栏目,让读者可以在学习过程中更轻松地理解相关知识点及概念。
本书读者
? 有一点Java编程基础的初学者
? 大数据处理与分析人员
? 从事后端开发,对大数据开发有兴趣的人员
? 想用Flink构建大数据应用的人员
? 想从事大数据技术工作的大中专院校学生
? Java开发和Java架构人员
? 大数据技术培训机构的师生
源码下载
源码下载,请用微信扫描右边二维码,可按页面提示,把下载链接转到自己邮箱下载。如果学习本书过程中发现问题,请联系[email protected],邮件主题为“Flink入门与实战”。
作 者
2021年3月
more >
暂无课件
暂无样章
暂无网络资源
扫描二维码
下载APP了解更多
版权图片链接
|